【レポート】業務データにあわせた AWS AI/ML サービスのチューニング #reinvent #JAP301
どーもsutoです。本記事はAWS re:Invent 2021のセッション「業務データにあわせた AWS AI/ML サービスのチューニング」のセッションレポートです。
すでにこのセッションはオンデマンドで公開されていますので、興味がある方はぜひそちらもご視聴ください。
セッション概要
AI/ML を活用してビジネスを成長させるためには、データ収集、データにもとづくAI/MLの改善、お客様満足度の向上というサイクルを実現することが重要です。このサイクルを支援するために、AWSでは、収集したデータを簡単に取り込んで、AWS AI/MLサービスをデータにあわせてチューニングして利用できる、AutoML のサービスを提供しています。本セッションでは、AWS における AutoMLサービスの利用方法について、まず概略を説明し、Amazon Rekognition Custom Labels、Amazon Personalize、Amazon SageMaker JumpStart など、個別のAutoMLサービスの詳細とユースケースについて紹介いたします。
- スピーカー(敬称略)
- 藤川 のぞみ(Nozomi Fujikawa)
- AI/ML Solutions Architect at AWS
- セッションレベル: Advanced - 300
- セッションID: JAP301
アジェンダ
- 機械学習のライフサイクルと課題、1つの解決策としてのAutoML
- AWSの機械学習スタックとAutoMLサービスの概要
- いくつかのAutoMLサービスとそのユースケース
機械学習のライフサイクルと課題、1つの解決策としてのAutoML
- 機械学習のワークロードのはなし
- 機械学習としての問題設定をした上で、モデリング、性能評価、デプロイ後のモデルの性能監視と継続的な再学習による改善を行う
- AutoMLの技術でプロセスの自動化が進んでいる
- ビジネスの価値のはなし
- 現実に解きたいビジネス課題と機械学習の問題をマッピング
- その機械学習の性能は現実においてどんな意味があるのか?を明らかにした上で、ビジネスゴールの達成可否、課題などを判断し、改善を行う
- ビジネスの理解が必要であり、人間のさまざまな試行錯誤が不可欠で、自動化が難しい部分
- AutoMLを使う利点
- 既成モデルに対応していないデータに合わせたモデルを構築できる。 ML の深い知識がなくても利用できる
- ML を開発する能力がある人にとっても、ゼロから作る場合と比べて 時間とコストを削減できる
- AWSの機械学習のスタック
- 既成のモデルをそのまま使う以外に、自前データでモデルをカスタマイズして使えるサービスが増えてきている
- モデル構築を自動化するサービスや機能が増えている
- 上記2件のサービスや機能をより簡単に利用できるようになってきている
AWSのAutoML
今回はAmazon Rekognition、Amazon Personalize、Amazon Lookout for Vision、SageMaker JumpStart+AutoML、GLUONを紹介(とくにAmazon Rekognitionを詳しくお話ししています)
Amazon Rekognition カスタムラベル
- 「機械」という画像のなかでも「ターボチャージャー」「トルクコンバータ」など細かい分類名として認識させたいときに、地震ドメインに固有のオブジェクトやシーンも検出可能
- 対応タスクは「シングルラベル分類」「マルチラベル分類」「物体検出」
- データセットを作成する方法
- Amazon Rekognition カスタムラベルの コンソール上で手動でラベル付け
- Amazon S3 のバケットからインポート
- Amazon SageMaker Ground Truth で ラベル付けされた画像をインポート
- モデル評価もAWSコンソール上で容易に可能
- テストデータセットでのクラスごとの精度などを表示可能
- テストデータセットでの画像ごとのラベルと確信度を表示可能
- 目的に合わせたモデルの活用方法:False Positive と False Negative のトレードオフの調整
- 継続的な改善のために(例:Amazon Augmented AI (A2I) の活用など)
Amazon Lookout for Vision
- コンピュータビジョンを使って製品の欠陥を検知して品質検査を自動化する
- ソースコードを書かずに外観検査モデルを構築し、外観検査状況をダッシュボードで確認可能
- 流れとしては、「画像の登録」→「モデルの学習」→「モデルの評価」→「外観検査」
SageMaker JumpStart
- 機械学習を簡単かつ迅速に始められる
- 15以上の一般的な ML ユースケースの構築済み ソリューションを活用(これらからカスタマイズも可能)
- 300を超えるオープンソースモデルの デプロイ時間を短縮
- 手順としても数クリックで機械学習を始められるレベルで迅速かつ簡単
- 自前のデータで再学習(Fine-tune Model)が可能
SageMaker Autopilot上でAutoML
- テーブルデータに対する予測と分類の機械学習のAutoML機能
- GUIで利用可能
AutoGluon
- MLモデル開発の自動化を実現する OSS
Amazon Personalize
- ユースケースに特化したアルゴリズムをパッケージング化して「レシピ」として提供
- USER_PERSONALIZATION:ユーザーにアイテムをリコメンド
- RELATED_ITEMS:似た商品をレコメンド
- PERSONALIZED_RANKING:特定のアイテム群をユーザー個々に並び替え
まとめ
- AI/ML活用でビジネス価値を創出していくには、さまざまな試行錯誤を行いながら、改善を続けるサイクルを回していくことが重要
- AutoMLはMLの試行錯誤を効率化し、MLの深い知識がなくても、あるいは時間やリソースをできるだけかけずにAI/ML活用を可能にする
- AWSでもさまざまな AutoML サービスを提供
- 有効活用しビジネス価値を創出
参考情報
- 各サービスのドキュメントについて
- https://docs.aws.amazon.com/ja_jp/index.html
- AWS の AI/ML サービスについて
- https://aws.amazon.com/jp/machine-learning/
- AWS の AutoML について
- https://aws.amazon.com/jp/machine-learning/automl/
感想
AWSの機械学習サービス系のアップデートは、開会学習内部のアルゴリズムをよく知らなくてもモデルの作成・評価・推論を迅速に体験できる機能やサービスがどんどん追加されてきて、機械学習に触れるためのハードルはホント低くなりましたね。
このセッションでは、環境の準備に手間をかけずに機械学習のプロセスを自動かつ迅速に実行できるサービスにフォーカスしていましたので、すぐにでも機械学習がもたらす結果を体験できる機能を知りたい方には良いセッションだと思いました。
しかしスピーカの方も前半で話していますが、機械学習をによってユーザーが思い描いているビジネス価値を得るには、ビジネス課題を明確にし機械学習で解決させたいゴールと結びつけること、そもそも機械学習で解決すべき問題なのかをしっかり定義しておくことが重要です。